12  Introducción al manejo de datos geoespaciales con R

12.1 Resumen

El lenguaje de programación R cuenta con una gran variedad de paquetes para manejo de datos geoespaciales, entre los que están el paquete sf para datos vectoriales, el paquete terra para datos raster y el paquete leaflet para mapas en la Web.

12.2 Trabajo previo

12.2.1 Lecturas

Lovelace, R., Nowosad, J., & Münchow, J. (2019). Geocomputation with R (capítulos 1 y 2). CRC Press. https://geocompr.robinlovelace.net/

12.3 Introducción

La comunidad de programadores de R ha desarrollado un conjunto de paquetes para el manejo de datos geoespaciales, tanto en formatos vectoriales como raster. Algunos de los principales de estos paquetes son:

  • El paquete sf. Ofrece un conjunto de funciones para el manejo de datos vectoriales, de acuerdo con el estándar Simple Features.

  • El paquete terra. Implementa un conjunto de funciones para el manejo de datos raster. Es una reimplementación del paquete raster.

  • El paquete leaflet. Es una implementación en R de la biblioteca Leaflet para el lenguaje JavaScript para la programación de mapas interactivos en páginas web.

Algunos paquetes de graficación estadística, como ggplot2 y plotly, también cuentan con capacidades para visualización de datos geoespaciales.

En CRAN Task View: Analysis of Spatial Data, puede encontrarse un resumen detallado de los paquetes de R con funciones geoespaciales.

12.4 Datos vectoriales

12.4.1 El modelo vectorial

El modelo vectorial de datos está basado en puntos localizados en un sistema de referencia de coordenadas (CRS). Los puntos individuales pueden representar objetos independientes (ej. postes eléctricos, cabinas telefónicas) o pueden también agruparse para formar geometrías más complejas como líneas (ej. ríos, caminos) o polígonos (ej. fincas, países, provincias). Por lo general, los puntos tienen solo dos dimensiones (x, y), a las que se les puede agregar una tercera dimensión z, usualmente correspondiente a la altitud sobre el nivel del mar.

12.4.2 El estándar Simple Features

Simple Features (o Simple Feature Access) es un estándar abierto de la Organización Internacional de Estandarización (ISO) y del Open Geospatial Consortium (OGC) que especifica un modelo común de almacenamiento y acceso para geometrías de dos dimensiones (líneas, polígonos, multilíneas, multipolígonos, etc.). El estándar es implementado por muchas bibliotecas y bases de datos geoespaciales como sf, Fiona, GDAL, PostgreSQL/PostGIS, SQLite/SpatiaLite, Oracle Spatial y Microsoft SQL Server, entre muchas otras.

La especificación define 17 tipos de geometrías, de las cuales siete son las más comúnmente utilizadas. Estas últimas se muestran en la Figura 12.1.

Figura 12.1: Tipos de geometrías de Simple Features más usadas. Imagen de Robin Lovelace et al..

12.4.3 El paquete sf

El paquete sf (de Simple Features) de R implementa los modelos de datos de las geometrías de tipo vectorial: puntos, líneas, polígonos, sus versiones múltiples y las colecciones de geometrías. Está basado en bibliotecas de sofware ampliamente utilizadas en aplicaciones geoespaciales:

sf provee acceso, desde un mismo paquete de R, a la funcionalidad de estas tres bibliotecas, proporcionando así una interfaz unificada para leer y escribir datos geoespaciales mediante GDAL, realizar operaciones con geometrías mediante GEOS y efectuar transformaciones entre sistemas de coordenadas mediante PROJ.

En sf, los conjuntos de datos geoespaciales se almacenan en objetos de una clase también llamada sf, los cuales son data frames que contiene una columna especial para las geometrías. Esta columna se denomina generalmente geom o geometry (aunque pueden tener cualquier otro nombre). El manejo de datos geoespaciales como data frames permite manipularlos con las funciones ya desarrolladas para este tipo de datos y con la misma forma de referenciar las filas (observaciones) y las columnas (variables).

12.4.3.1 Instalación y carga

# Instalación de sf
install.packages("sf")
# Carga de sf
library(sf)

12.4.3.2 Métodos

La lista de métodos (i.e. funciones) de la clase sf puede obtenerse a través de la función methods():

# Métodos de la clase sf
methods(class = "sf")
 [1] [                     [[<-                  $<-                  
 [4] aggregate             as.data.frame         cbind                
 [7] coerce                dbDataType            dbWriteTable         
[10] filter                identify              initialize           
[13] merge                 plot                  print                
[16] rbind                 show                  slotsFromS3          
[19] st_agr                st_agr<-              st_area              
[22] st_as_s2              st_as_sf              st_as_sfc            
[25] st_bbox               st_boundary           st_buffer            
[28] st_cast               st_centroid           st_collection_extract
[31] st_convex_hull        st_coordinates        st_crop              
[34] st_crs                st_crs<-              st_difference        
[37] st_filter             st_geometry           st_geometry<-        
[40] st_inscribed_circle   st_interpolate_aw     st_intersection      
[43] st_intersects         st_is_valid           st_is                
[46] st_join               st_line_merge         st_m_range           
[49] st_make_valid         st_nearest_points     st_node              
[52] st_normalize          st_point_on_surface   st_polygonize        
[55] st_precision          st_reverse            st_sample            
[58] st_segmentize         st_set_precision      st_shift_longitude   
[61] st_simplify           st_snap               st_sym_difference    
[64] st_transform          st_triangulate        st_union             
[67] st_voronoi            st_wrap_dateline      st_write             
[70] st_z_range            st_zm                 transform            
see '?methods' for accessing help and source code

Seguidamente, se describen y ejemplifican algunos de los métodos básicos de la clase sf.

12.4.3.2.1 st_read() - lectura de datos

El método st_read() lee datos vectoriales de una fuente en formato geoespacial (ej. shapefiles, archivos GeoJSON, bases de datos geoespaciales) y los recupera en un objeto sf.

En el siguiente bloque de código en R, se utiliza el método st_read() para leer un archivo GeoJSON con los polígonos de las provincias de Costa Rica. Este archivo proviene de un geoservicio de tipo Web Feature Service (WFS) publicado por el Instituto Geográfico Nacional (IGN).

# Lectura de una capa vectorial (GeoJSON) de provincias de Costa Rica
provincias <-
  st_read(
    "https://raw.githubusercontent.com/gf0604-procesamientodatosgeograficos/2023-i/main/datos/ign/delimitacion-territorial-administrativa/provincias.geojson",
    quiet = TRUE # para evitar el despliegue de mensajes
  )

st_read() también puede crear objetos sf a partir de archivos de texto. Esta variante se utiliza principalmente cuando el archivo contiene coordenadas correspondientes a geometrías de puntos.

En el siguiente bloque de código, se utiliza st_read() para leer un archivo CSV con registros de presencia de felinos de Costa Rica, el cual contiene dos columnas llamadas decimalLongitude y decimalLatitude correspondientes a la longitud decimal y latitud decimal en las que fue observado cada felino. Este archivo proviene de una consulta al portal de datos de la Infraestructura Mundial de Información en Biodiversidad (GBIF).

# Lectura de un archivo CSV con registros de presencia de felinos en Costa Rica
felinos <-
  st_read(
    "https://raw.githubusercontent.com/gf0604-procesamientodatosgeograficos/2023-i/main/datos/gbif/felinos.csv",
    options = c(
      "X_POSSIBLE_NAMES=decimalLongitude", # columna de longitud decimal
      "Y_POSSIBLE_NAMES=decimalLatitude"   # columna de latitud decimal
    ),
    quiet = TRUE
  )

Tanto provincias como felinos son objetos de la clase sf (y además de data.frame).

# Clase del objeto provincias
class(provincias)
[1] "sf"         "data.frame"
# Clase del objeto felinos
class(felinos)
[1] "sf"         "data.frame"

Al escribirse el nombre de un objeto sf en la consola de R, se despliega información general sobre este.

# Información general sobre el objeto provincias
provincias
Simple feature collection with 7 features and 6 fields
Geometry type: MULTIPOLYGON
Dimension:     XY
Bounding box:  xmin: 156152 ymin: 608833.8 xmax: 658879.5 ymax: 1241118
Projected CRS: CR05 / CRTM05
  cod_catalo cod_provin  provincia
1     160103          6 Puntarenas
2     160103          1   San José
3     160103          7      Limón
4     160103          3    Cartago
5     160103          2   Alajuela
6     160103          5 Guanacaste
7     160103          4    Heredia
                                                                                                                                                                                                                 ori_toponi
1 En documento de 1720, se menciona la llegada del pirata Chipperton a la zona, en el cual aparece la descripcíon referente a una embarcación pequeña en la Punta de Arena, adoptando con el tiempo el nombre de Puntarenas
2                                                                                                                                              Se remonta a la creación de la ermita dedicada al Patriarca San José en 1737
3                                                                                         El origen del nombre de la provincia se remonta a 1852, cuando por primera vez se cita en un documento oficial el puerto de Limón
4                                         Don Juan Vázques de Coronado escogió el sitio en el valle del Guarco para trasladar a la ciudad de Garcimuños, en 1563, bautizando al nuevo asentamiento con el nombre de Cartago
5                                                                                                                  Se remonta al paraje llamado La Lajuela que por primera vez se cita en los Protocolos de Cartago de 1657
6        En alegoria a un frondoso árbol de Guanacaste ubicado en la intersección de los caminos que se dirigían a Nicoya, Bagaces y Rivas, en lo que hoy día es el parque de Liberia. Esta referencia data del siglo XVIII
7                                        En correspondiencia al Presidente  de la Real Audiencia de Guatemala, Capitán General don Alonso Fernández de Heredia, de la Inmaculada Concepción de Cubujuquí a Villa de Heredia
      area  version                       geometry
1 11298.51 20201222 MULTIPOLYGON (((159917.7 60...
2  4969.73 20201222 MULTIPOLYGON (((505765.3 11...
3  9176.96 20201222 MULTIPOLYGON (((532516.6 12...
4  3093.23 20201222 MULTIPOLYGON (((556146.1 10...
5  9772.27 20201222 MULTIPOLYGON (((427195 1224...
6 10196.32 20201222 MULTIPOLYGON (((380807.3 11...
7  2663.46 20201222 MULTIPOLYGON (((497345.1 11...
12.4.3.2.2 st_crs() y st_transform() - manejo de sistemas de coordenadas

El método st_crs() retorna el CRS de un objeto sf.

# Despliegue del CRS del objeto provincias
st_crs(provincias)
Coordinate Reference System:
  User input: CR05 / CRTM05 
  wkt:
PROJCRS["CR05 / CRTM05",
    BASEGEOGCRS["CR05",
        DATUM["Costa Rica 2005",
            ELLIPSOID["WGS 84",6378137,298.257223563,
                LENGTHUNIT["metre",1]]],
        PRIMEM["Greenwich",0,
            ANGLEUNIT["degree",0.0174532925199433]],
        ID["EPSG",5365]],
    CONVERSION["Costa Rica TM 2005",
        METHOD["Transverse Mercator",
            ID["EPSG",9807]],
        PARAMETER["Latitude of natural origin",0,
            ANGLEUNIT["degree",0.0174532925199433],
            ID["EPSG",8801]],
        PARAMETER["Longitude of natural origin",-84,
            ANGLEUNIT["degree",0.0174532925199433],
            ID["EPSG",8802]],
        PARAMETER["Scale factor at natural origin",0.9999,
            SCALEUNIT["unity",1],
            ID["EPSG",8805]],
        PARAMETER["False easting",500000,
            LENGTHUNIT["metre",1],
            ID["EPSG",8806]],
        PARAMETER["False northing",0,
            LENGTHUNIT["metre",1],
            ID["EPSG",8807]]],
    CS[Cartesian,2],
        AXIS["northing (N)",north,
            ORDER[1],
            LENGTHUNIT["metre",1]],
        AXIS["easting (E)",east,
            ORDER[2],
            LENGTHUNIT["metre",1]],
    USAGE[
        SCOPE["Cadastre, engineering survey, topographic mapping (large and medium scale)."],
        AREA["Costa Rica - onshore and offshore east of 86°30'W."],
        BBOX[2.21,-86.5,11.77,-81.43]],
    ID["EPSG",5367]]
# Despliegue CRS del objeto felinos
st_crs(felinos)
Coordinate Reference System: NA

st_crs() también puede asignar un CRS a un objeto sf que no lo tiene.

# Asignación de un CRS al objeto felinos
st_crs(felinos) <- 4326

El método st_transform() transforma un objeto sf a un nuevo CRS.

# Transformación del CRS del objeto provincias a WGS84 (EPSG = 4326)
provincias <-
  provincias |>
  st_transform(4326)
12.4.3.2.3 plot() - mapeo

El método plot() grafica objetos sf en un mapa.

# Mapeo de las geometrías del objeto provincias
plot(provincias$geometry)

# Mapeo con argumentos adicionales de plot()
plot(
  provincias$geometry,
  extent = st_bbox(c(xmin = -86.0, xmax = -82.3, ymin = 8.0, ymax = 11.3)),
  main = "Provincias de Costa Rica",
  axes = TRUE,
  graticule = TRUE
)

Los argumentos reset y add de plot() permiten generar un mapa con varias capas.

# Primera capa del mapa
plot(
  provincias$geometry,
  extent = st_bbox(c(xmin = -86.0, xmax = -82.3, ymin = 8.0, ymax = 11.3)),
  main = "Registros de presencia de felinos en Costa Rica",
  axes = TRUE,
  graticule = TRUE,
  reset = FALSE
)

# Segunda capa
plot(felinos$geometry,
     add = TRUE,     
     pch = 16,
     col = "blue")

Para conocer los valores del argumento pch, puede consultar R plot pch symbols.

12.4.3.2.4 st_write() - escritura de datos

El método st_write() guarda en el disco un objeto sf en los diferentes formatos vectoriales de GDAL.

# Especificación del directorio de trabajo (debe utilizarse una ruta existente)
setwd("/home/mfvargas")

# Escritura del objeto provincias en formato GPKG
provincias |>
  st_write("provincias.gpkg")

# Escritura del objeto felinos en formato KML
felinos |>
  st_write("felinos.kml")
12.4.3.2.5 Otros
# Cantidad de filas de un objeto sf
nrow(provincias)
[1] 7
# Cantidad de columnas de un objeto sf
ncol(provincias)
[1] 7
# Resumen de la columna de geometría
summary(provincias$geometry)
 MULTIPOLYGON     epsg:4326 +proj=long... 
            7             0             0 

12.4.4 Mapeo de objetos sf con otros paquetes

12.4.4.1 leaflet

El paquete leaflet genera mapas interactivos en lenguaje de marcado de hipertexto (HTML), el lenguaje de marcado utilizado para desarrollar páginas web.

12.4.4.1.1 Instalación y carga
# Instalación de leaflet
install.packages("leaflet")

# Instalación de leaflet.extras (funciones adicionales de leaflet)
install.packages("leaflet.extras")

# Instalación de leaflem (funciones adicionales de leaflet)
install.packages("leafem")
# Carga de leaflet
library(leaflet)

# Carga de leaflet.extras
library(leaflet.extras)

# Carga de leafem
library(leafem)

El siguiente bloque de código muestra las capas de provincias (polígonos) y de registros de presencia de felinos (puntos) sobre una capa base de OpenStreetMap (OSM) y otra de ESRI.

# Mapa leaflet básico de provincias y registros de presencia de felinos
leaflet() |>
  setView(# centro y nivel inicial de acercamiento
    lng = -84.19452,
    lat = 9.572735,
    zoom = 7) |>
  addTiles(group = "Mapa general (OpenStreetMap)") |>
  addProviderTiles(
    providers$Esri.WorldImagery, 
    group = "Imágenes satelitales (ESRI World Imagery)"
  ) |>
  addPolygons(
    # capa de provincias (polígonos)
    data = provincias,
    color = "black",
    fillColor = "transparent",
    stroke = TRUE,
    weight = 1.0,
    group = "Provincias"
  ) |>
  addCircleMarkers(
    # capa de registros de presencia (puntos)
    data = felinos,
    stroke = F,
    radius = 4,
    fillColor = 'blue',
    fillOpacity = 1,
    popup = paste(
      paste0("<strong>Especie: </strong>", felinos$species),
      paste0("<strong>Localidad: </strong>", felinos$locality),
      paste0("<strong>Fecha: </strong>", felinos$eventDate),
      paste0("<strong>Fuente: </strong>", felinos$institutionCode),
      paste0("<a href='", felinos$occurrenceID, "'>Más información</a>"),
      sep = '<br/>'
    ),
    group = "Felinos"
  ) |>
  addLayersControl(
    baseGroups = c(
      "Mapa general (OpenStreetMap)", 
      "Imágenes satelitales (ESRI World Imagery)"
    ),
    overlayGroups = c("Provincias", "Felinos")) |> # control de capas
  addResetMapButton() |> # botón de reinicio
  addSearchOSM() |> # búsqueda en OSM
  addMouseCoordinates() |> # coordenadas del puntero del ratón
  addScaleBar(
    position = "bottomleft", 
    options = scaleBarOptions(imperial = FALSE)
  ) |> # barra de escala
  addMiniMap(position = "bottomright") |> # mapa de ubicación
  addFullscreenControl() # mapa de pantalla completa

12.4.5 Ejercicios

  1. Agregue capas base adicionales al mapa anterior, con la función leaflet::addProviderTiles() (vea Leaflet for R - Using Basemaps).
  2. Agrupe los puntos correspondientes a los registros de presencia mediante la función markerClusterOptions() (vea Leaflet for R - Markers).
  3. Genere una capa de calor (heat map) con la función leaflet.extras::addHeatmap().